iT邦幫忙

2023 iThome 鐵人賽

DAY 10
0
自我挑戰組

網路爬蟲系列 第 10

【Day10】網路爬蟲-認識HTTP標頭與httpbin.org服務

  • 分享至 

  • xImage
  •  

HTTP標頭

Python程式或瀏覽器是向Web伺服器送出HTTP請求後,才可以從Web伺服器取得回應資料的網頁內容,而瀏覽器和Web伺服器之間的通話內容就包含了HTTP標頭。
HTTP請求
從瀏覽器送去Web伺服器的訊息,使用HTTP標頭提供請求相關的資訊

GET /test.html HTTP/1.1
Host: hueyanch.myweb.hinet.net
Connection: keep-alive
Upgrade-Insecure-Requests: 1

HTTP回應
Web回應瀏覽器的回應訊息

HTTP/1.1 200 ok
Date: Sun, 15 Jul 2018 03:11:20 GMT
Server: Apache

HTTP標頭內容
主要包含三種資訊
1.一般標頭:這些是請求和回應訊息的一般資訊,例如:快取控制和編碼。
2.客戶端請求標頭:一些關於請求訊息的標頭資訊,包含:回應的檔案MIME類型、請求方法、代理人資訊等。
3.伺服端回應標頭:關於回應訊息的標頭資訊,包含:轉址的URL網址、伺服器軟體,和設定Cookie資料。


上一篇
【Day9】網路爬蟲-認識JSON
下一篇
【Day11】網路爬蟲-使用Requests送出HTTP請求
系列文
網路爬蟲30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言